0
作者丨王悅
編輯丨董子博
從線下交易轉為線上交易的第一步,便是開戶的身份認證。
在菲律賓開通一個貨幣賬戶,到底有多難?來自中國的技術專家親眼目睹了當地居民,乘坐一個多小時的公交車,來到一個網點,提交一堆紙質資料,資料被集中送到一個審核點,再去等待漫長的純人工審核。
正常情況下,從遞交資料到賬戶開通,整個流程耗時約一個星期,如果用戶量翻倍,人工審核團隊的人數也要隨之翻倍。
受到人力、門店數量等限制,開戶認證過程效率低、體驗差,通過率自然非常低,能真正堅持下來完成開通的用戶只有發(fā)起者的3%。
某機構一天只能服務幾十個用戶,等待做身份認證的用戶排到了一年以后。
身份認證專家卻“難證清白”
螞蟻集團安全科技平臺ZOLOZ的李哲認為,只有用數字技術做身份認證,才能夠擺脫人力瓶頸,實現高效便捷的開戶體驗,為數字化發(fā)展提速。
于是他背起行囊,雄心勃勃,準備用自己多年的技術能力奔赴菲律賓,開啟線上身份認證的“拓荒”之旅。
而現實卻給了這位中國身份認證專家“當頭一棒”。李哲剛到菲律賓,就被機場海關攔入了“小黑屋”。
原因是,當地剛剛發(fā)生一起案件,在逃嫌疑人也叫“LI ZHE”。
簽證信息有限,當地海關沒法確認此“李哲”非彼“LI ZHE”,李哲不得不親自跑去當地移民局,填寫書面材料,當面說明自己不是那個“LI ZHE”,又去當地法院,說明自己沒有犯罪。
兩個機構開具的證明要在以后的每次出入境時都隨身攜帶,否則還是會發(fā)生與之前一樣的遭遇。而諷刺的是,李哲前腳剛剛走出移民局大門,一群黃牛就蜂擁而至,追著問:
“假證要不要辦?”
李哲萬萬沒想到,工作還沒展開,就陷入自身難“證”的境地,人肉體驗了一把當地的身份認證狀況,他也迅速意識到了問題的嚴峻。
李哲為證明自己不是某某某而填寫的材料
撥開“假證”迷霧,認清“你是你”
019年9月的某天,馬尼拉的雷克托大街上,突然一陣喧嘩嘈雜。
接到線報稱,此處有不法分子正在制造虛假的身份證和駕駛證,菲律賓的警方突擊了當地的一個假證制造窩點。僅在這一次行動中,工作人員就查獲了342張假駕駛證。
在當地,制造一本假駕駛證,不法分子就可以獲得1000比索,而一本偽造的菲律賓護照,就能在黑市上買到3500比索。
猖獗的黑產背后,其有恃無恐之處在于當時并不發(fā)達的假證識別技術,這直接鍛造了五花八門的造假手段:對電腦或手機屏幕翻拍并不屬于自己的證件、拍攝打印復印件、遮擋篡改、高仿定制等。
除了造假手段多樣化之外,近30種證件都被認可為官方證件,卻沒有統(tǒng)一官方庫可以進行信息比對,也給身份認證帶來巨大的障礙。
ZOLOZ想在一帶一路沿線國家和地區(qū),實現的是和中國一樣,用戶全自助、無人工干預完成金融機構的“在線身份認證”,機器遠程識別“你是誰”,以及準確判斷“你是你”,你不是那個被別人冒充的你。
當時品類繁多的菲律賓證件在版面設計與制證工藝上存在很大差異,主體色彩、底紋樣式、防偽膜、照片、格式與順序、字體樣式等要素各有特點,需要用到OCR技術識別每一個證件上面的文字信息,從而完成“讓機器識別你是誰”這第一個小目標。
然而,更大的挑戰(zhàn)在于“如何準確判斷你是你”,以應對身份篡改、冒用,帶來的欺詐、薅羊毛、洗錢風險。
魔高一尺,道高一丈。在圖像識別方面,ZOLOZ算法團隊敏銳地發(fā)現了翻拍證件圖片通常帶有明顯的摩爾紋圖案或者反光特征,并且在一些拍攝角度下,還能觀察到圖片中屏幕邊框,窗口邊框等,采用細粒度識別技術,他們提出了多尺度的證件翻拍檢測算法。
ZOLOZ團隊還發(fā)現了“用打印件冒充真實證件”的檢測突破口,由于兩者材質不同,當有平行光射入時,兩者具有不同的漫反射率。因此,他們嘗試改變產品交互,在拍攝證件的瞬間開啟閃光燈,通過“閃光幀”來甄別打印件;此外,通過遮擋區(qū)域邊緣的梯度異常(陰影)和遮擋區(qū)域內部的紋理差異信息,來判斷證件是否被遮擋篡改……
結合這些發(fā)現,ZOLOZ探索了一套全球證件防偽算法體系,在2019年,ZOLOZ成為全球首家通過HKMA(香港金融管理局)警署假證測試的企業(yè)。截至目前,相關技術已經產出相關專利100余篇。
保護數據隱私,讓模型左右手互搏
找到了假證識別的突破口,ZOLOZ團隊又馬上要迎接一個新的命題。
訓練數據是模型訓練、迭代的基礎,但可用于模型訓練的攻擊樣本數據非常少。而團隊基于數據隱私保護的準則,對真實數據的調用也極度克制。不同于其他的AI領域,在安全攻防方向上,預訓練階段“不用真實數據訓練"的理念似乎已在團隊內約定俗成。
“如果真要收集足夠的真實樣本再去升級模型,可能還沒升級完,就已經被‘打趴下了’。我們要在隱私保護的原則下,找到其他的突破口?!?ZOLOZ 身份安全算法負責人李哲告訴雷峰網。
于是,ZOLOZ自研了兩套快速生成數據的方法,即物理生成和數字生成。
所謂物理生成,就是模仿黑產的攻擊套路、變換各種姿勢,自己制作可供模型訓練的假證樣本。
疫情期間的一個春節(jié),ZOLOZ 團隊的一名工作人員,和他的家人剛剛吃完年夜飯,圍坐在餐桌前。不同于其他人家,新年夜一起包餃子,他們手里剪刀飛舞,把一張張網上下載的圖片打印下來按照一定規(guī)格剪好,再遮擋在證件上,并且拍照留檔。
起初,一張一張剪起來很慢,一家人一個小時只能剪出幾十張。熟練后,一小時能剪出一百多張。
“人家過年都是剪窗花,咱們家過年是剪圖片。”家人打趣說道。
除夕夜發(fā)動全家老小做人工智能訓練師的“壯舉”,是為了給 ZOLOZ 制作“篡改遮蓋攻擊”的負樣本,就像金庸小說里的左右手互搏,巨大的3000份攻擊樣本數量為模型練就了一身硬朗結實的腱子肉,提升照片遮擋攻擊測試的防御力。
而此舉也幫助ZOLOZ在春節(jié)后的一次競標中,超越競爭對手,贏得了菲律賓當時最大銀行的訂單。
數字生成,顯然比物理生成更“高級”。ZOLOZ用起了AIGC 批量生成攻擊數據樣本,利用生成的樣本同樣可以實現訓練模型的結果,效率更高,效果更逼真。為了增加其生成數據的多樣性,ZOLOZ嘗試去更換手機型號,攝像頭類型,屏幕邊框和拍攝環(huán)境等。
此外,借助 Stable Diffusion 模型,能對憑證圖像進行更豐富的拍屏風格渲染,也能對現有拍屏模型進行摩爾紋對抗攻擊等。
AIGC 還幫助 ZOLOZ 擴展現有的數據特征空間,預測到更多新型證件材質偽造類型,引入更多對抗攻擊樣本來提高模型的防御能力。
這種方式被稱為“冷啟動”,在數據隱私保護的前提下,讓模型在小樣本學習中迅速上手。
李哲介紹,如今ZOLOZ的通用防偽能力已經支持全球十多個國家的上百種證件類型,其中大部分證件的防偽標識可以被識別,并具備防御高仿假證的能力,處于業(yè)界領先的水平。而冷啟動時運用的數據幾乎均由AIGC生成,極大地減少了真實數據的使用量。而在線上發(fā)現的少量真實的攻擊數據成為了模型的測試集,為模型進行調優(yōu)。
用AIGC打敗AIGC
AIGC 給ZOLOZ帶來了巨大的助力,而 ZOLOZ 也清楚地看到,雖然目前大多數黑產攻擊仍然采用物理生成的方式,但隨著AIGC技術的普及,黑產也可能利用AIGC生成更高仿真性和迷惑性的假證,ZOLOZ務必從現在就開始打磨辨別AIGC的能力。
ZOLOZ給出的應對方案是利用自己的AIGC算法,生成大量看起來逼真的證件圖片數據,用來訓練另一個可以識別AIGC的模型。
李哲對AI科技評論表示道:“為了讓訓練的模型更加魯棒,在這個過程中還可以加入對抗技術,根據識別模型在生成數據上的表現,反過來指導優(yōu)化AIGC算法,再生成更多可以繞過識別模型的樣本,從而不斷增強識別模型的泛化能力?!?/p>
以左手搏右手,以魔法打敗魔法——用AIGC技術,來打敗未來AIGC的風險,ZOLOZ 的這條路徑,未來很可能變成安全認證的一大趨勢。
在李哲看來,每道單一的防線也許都不能做到100%完美防御,因此,ZOLOZ不僅僅做圖像識別,還結合綜合數據決策來實現全鏈路的縱深防御策略,從注冊環(huán)節(jié)、到開戶環(huán)節(jié)、再到支付驗證環(huán)節(jié),讓多道防線相互補充,形成相對堅實、可信的身份認證體系。
如今,菲律賓電子錢包Gcash的開戶時間,從原來的一周降到只需要在家操作3分鐘。Gcash的注冊用戶數超過6600萬,每1.7個菲律賓人就有一位在使用。
疫情期間,ZOLOZ 提供的可信身份認證幫助孟加拉國500萬個家庭實現遠程開戶,當地政府通過本地最大的移動支付平臺BKash,向失去收入來源的家庭發(fā)放援助金。也因此,ZOLOZ 在2021年獲得了IDC金融科技真實價值獎。BKash CEO卡邁勒·奎德表示:“ZOLOZ 幫助BKash實現了跳躍式發(fā)展,在疫情期間,e-KYC成了我們的救星?!?/p>
截止目前,ZOLOZ已經為一帶一路沿線國家和地區(qū)的上百家合作伙伴提供在線身份認證、風控決策等技術支持,覆蓋銀行、保險、證券、電信、公眾服務等領域。
本文作者:王悅,微信s1060788086。雷峰網(公眾號:雷峰網)將持續(xù)關注AIGC、大模型、數字人等領域,歡迎添加作者微信,交流行業(yè)信息。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。